当前位置: 开发笔记 > 编程语言 > 正文

问|MySQL为什么会"错误"的选择代价更大的索引

作者：哈王豐3_408 | 来源：互联网 | 2023-09-09 17:27

MySQL为什么会错误的

1. 问题描述

群友提出问题，表里有两个列c1、c2，分别为INT、VARCHAR类型，且分别创建了unique key。

SQL查询的条件是 WHERE c1 = ? AND c2 = ?
，用EXPLAIN查看执行计划，发现优化器优先选择了VARCHAR类型的c2列索引。

他表示很不理解，难道不应该选择看起来代价更小的INT类型的c1列吗？

2. 问题复现

创建测试表t1：

[root@yejr.run]> CREATE TABLE `t1` ( `c1` int NOT NULL AUTO_INCREMENT, `c2` int unsigned NOT NULL, `c3` varchar(20) NOT NULL, `c4` varchar(20) NOT NULL, PRIMARY KEY (`c1`), UNIQUE KEY `k3` (`c3`), UNIQUE KEY `k2` (`c2`) ) ENGINE=InnoDB;

利用 mysql_random_data_load
写入一万行数据：

mysql_random_data_load -h127.0.0.1 -uX -pX yejr t1 10000

查看执行计划：

[root@yejr.run]> EXPLAIN SELECT * FROM t1 WHERE c2 = 1755950419 AND c3 = 'MichaelaAnderson'\G *************************** 1. row *************************** id: 1 select_type: SIMPLE table: t1 partitions: NULL type: const possible_keys: k3,k2 key: k3 key_len: 82 ref: const rows: 1 filtered: 100.00 Extra: NULL

可以看到优化器的确选择了 k3 索引，而非"预期"的 k2 索引，这是为什么呢？

3. 问题分析

其实原因很简单粗暴：优化器认为这两个索引选择的代价都是一样的，只是优先选中排在前面的那个索引而已。

再建一个相同的表 t2，只不过把 k2、k3 的索引创建顺序对调下：

[root@yejr.run]> CREATE TABLE `t2` ( `c1` int NOT NULL AUTO_INCREMENT, `c2` int unsigned NOT NULL, `c3` varchar(20) NOT NULL, `c4` varchar(20) NOT NULL, PRIMARY KEY (`c1`), UNIQUE KEY `k2` (`c2`), UNIQUE KEY `k3` (`c3`) ) ENGINE=InnoDB;

再查看执行计划：

[root@yejr.run]> EXPLAIN SELECT * FROM t2 WHERE c2 = 1755950419 AND c3 = 'MichaelaAnderson'\G *************************** 1. row *************************** id: 1 select_type: SIMPLE table: t1 partitions: NULL type: const possible_keys: k2,k3 key: k2 key_len: 4 ref: const rows: 1 filtered: 100.00 Extra: NULL

我们利用 EXPLAIN ANALYZE
来查看下两次执行计划的代价对比：

-- 查看t1表执行计划代价 [root@yejr.run]> EXPLAIN ANALYZE SELECT * FROM t1 WHERE c2 = 1755950419 AND c3 = 'MichaelaAnderson'\G *************************** 1. row *************************** EXPLAIN: -> Rows fetched before execution (cost=0.00..0.00 rows=1) (actual time=0.000..0.000 rows=1 loops=1) -- 查看t2表执行计划代价 [root@yejr.run]> EXPLAIN ANALYZE SELECT * FROM t2 WHERE c2 = 1755950419 AND c3 = 'MichaelaAnderson'\G *************************** 1. row *************************** EXPLAIN: -> Rows fetched before execution (cost=0.00..0.00 rows=1) (actual time=0.000..0.000 rows=1 loops=1)

可以看到，很明显代价都是一样的。

再利用 OPTIMIZE_TRACE
查看执行计划，也能看到两个SQL的代价是一样的：

... { "rows_estimation": [ { "table": "`t1`", "rows": 1, "cost": 1, "table_type": "const", "empty": false } ] }, ...

所以，优化器认为选择哪个索引都是一样的，就看哪个索引排序更靠前。

从执行SELECT时的debug trace结果也能佐证：

4. 问题延伸

到这里，我们不禁有疑问，这两个索引的代价真的是一样吗？

就让我们用 mysqlslap
来做个简单对比测试吧：

-- 测试1：对c2列随机point select mysqlslap -hlocalhost -uroot -Smysql.sock --no-drop --create-schema X -i 3 --number-of-queries 1000000 -q "set @xid = cast(round(rand()*2147265929) as unsigned); select * from t1 where c2 = @xid" -c 8 ... Average number of seconds to run all queries: 9.483 seconds ... -- 测试2：对c3列随机point select mysqlslap -hlocalhost -uroot -Smysql.sock --no-drop --create-schema X -i 3 --number-of-queries 1000000 -q "set @xid = concat('u',cast(round(rand()*2147265929) as unsigned)); select * from t1 where c3 = @xid" -c 8 ... Average number of seconds to run all queries: 10.360 seconds ...

可以看到，如果是走 c3 列索引，耗时会比走 c2 列索引多出来约 7% ~ 9%（在我的环境下测试的结果，不同环境、不同数据量可能也不同）。

看来，MySQL优化器还是有必要进一步提高的哟：）

测试使用版本：GreatSQL 8.0.25
（MySQL 5.6.39结果亦是如此）。

文章推荐：

面向金融级应用的GreatSQL正式开源

文章结束。

以下是个人微信公众号，欢迎关注：

推荐阅读

int
PostgreSQL与MySQL的语法差异详解

本文详细介绍了PostgreSQL与MySQL在SQL语法上的主要区别，包括如何使用COALESCE替代IFNULL、金额格式化的方法、别名处理以及日期处理等关键点。 ... [详细]

蜡笔小新 2024-11-21 07:40:22
int
Maven + Spring + MyBatis + MySQL 环境搭建与实例解析

本文详细介绍如何使用MySQL数据库进行环境搭建，包括创建数据库表并插入示例数据。随后，逐步指导如何配置Maven项目，整合Spring框架与MyBatis，实现高效的数据访问。 ... [详细]

蜡笔小新 2024-11-21 18:39:23
int
Oracle 11g 创建表空间与基础配置

本文详细介绍了Oracle 11g中的创建表空间的方法，以及如何设置客户端和服务端的基本配置，包括用户管理、环境变量配置等。 ... [详细]

蜡笔小新 2024-11-21 18:54:39
int
SQL Server 存储过程实现高效分页查询

本文介绍了一种使用SQL Server存储过程来实现基于单一条件的高效分页查询的方法。通过示例代码，详细说明了如何构建和执行这种分页查询。 ... [详细]

蜡笔小新 2024-11-21 17:23:20
int
如何将955万数据表的17秒SQL查询优化至300毫秒

本文详细介绍了通过优化SQL查询策略，成功将一张包含955万条记录的财务流水表的查询时间从17秒缩短至300毫秒的方法。文章不仅提供了具体的SQL优化技巧，还深入探讨了背后的数据库原理。 ... [详细]

蜡笔小新 2024-11-21 12:11:54
int
IC卡操作功能实现

本文介绍了如何通过C#语言调用动态链接库（DLL）中的函数来实现IC卡的基本操作，包括初始化设备、设置密码模式、获取设备状态等，并详细展示了将TextBox中的数据写入IC卡的具体实现方法。 ... [详细]

蜡笔小新 2024-11-21 11:02:19
int
解决SQL Server中几何类型列的INTERSECT操作问题

本文探讨了在SQL Server中处理几何类型列时遇到的INTERSECT操作限制，并提供了解决方案，包括通过转换数据类型和使用额外表结构的方法。 ... [详细]

蜡笔小新 2024-11-20 20:09:58
int
linux网络子系统分析（二）—— 协议栈分层框架的建立

目录一、综述二、INET的初始化2.1INET接口注册2.2抽象实体的建立2.3代码细节分析2.3.1socket参数三、其他协议3.1PF_PACKET3.2P ... [详细]

蜡笔小新 2024-11-20 15:21:14
int
php + layui 文件上传以及拖拽上传

HTML:　　将文件拖拽到此区域 ... [详细]

蜡笔小新 2024-11-20 14:27:32
int
UVALive 8201 - BBP 公式计算圆周率

在1995年，Simon Plouffe 发现了一种特殊的求和方法来表示某些常数。两年后，Bailey 和 Borwein 在他们的论文中发表了这一发现，这种方法被命名为 Bailey-Borwein-Plouffe (BBP) 公式。该问题要求计算圆周率 π 的第 n 个十六进制数字。 ... [详细]

蜡笔小新 2024-11-21 18:32:57
int
二维码的实现与应用

本文介绍了二维码的基本概念、分类及其优缺点，并详细描述了如何使用Java编程语言结合第三方库（如ZXing和qrcode.jar）来实现二维码的生成与解析。 ... [详细]

蜡笔小新 2024-11-21 17:10:15
int
JUnit下的测试和suite

nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]

蜡笔小新 2024-11-21 16:03:49
int
探究64位Linux系统下32位程序的兼容性问题——以OpenVPN为例

本文通过分析一个具体的案例，探讨了64位Linux系统对32位应用程序的兼容性问题。案例涉及OpenVPN客户端在64位系统上的异常行为，通过逐步排查和代码测试，最终定位到了与TUN/TAP设备相关的系统调用兼容性问题。 ... [详细]

蜡笔小新 2024-11-20 16:34:58
int
大数据量下的SQL分页查询性能优化策略

在处理大数据量的SQL分页查询时，通常需要执行两次查询来分别获取数据和总记录数。本文介绍了一种优化方法，通过单次查询同时返回分页数据和总记录数，从而提高查询效率。 ... [详细]

蜡笔小新 2024-11-20 13:54:29
int
在Windows环境中配置和使用Lex与Yacc

本文详细介绍了如何在Windows操作系统中配置和使用Lex（Flex）与Yacc（Bison），包括软件的下载、安装以及通过示例验证其正确性的步骤。 ... [详细]

蜡笔小新 2024-11-20 13:44:49

哈王豐3_408

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章